ترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات

thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
author فاطمه فتحی نژاد
adviser ولی درهمی مهدی رضاییان
Number of pages: First 15 pages
publication year 1391

abstract

استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّر از هر دو الگوریتم یادگیری فوق ارائه می شود. یک کنترلگر فازی سوگنو مرتبه صفر با تعدادی عمل کاندید برای هر قاعده جهت تولید فرمان های کنترل ربات در نظر گرفته شده است، بطوریکه ساختار این کنترلگر با ساختار کنترلگر یادگیری سارسایِ فازی که یک الگوریتم آموزش تقویتی پیوسته می باشد، سازگاری دارد. هدف از آموزش تعیین عمل مناسب برای هر قاعده است. در مرحله اول داده آموزشی با حرکت ربات توسط ناظر در محیط جمع آوری می شود. سپس با بهره گیری از روش جدید ارائه شده، پارامترهای ارزش هر عمل کاندید در قواعد فازی با کمک داده های آموزشی مقداردهی اولیه می شوند. در مرحله دوم از الگوریتم سارسایِ فازی برای تنظیم دقیق تر پارامترهای تالی کنترلگر بصورت برخط استفاده می شود. نتایج شبیه سازی در شبیه ساز kiks برای ربات خپرا حاکی از بهبود قابل توجه در زمان یادگیری و کیفیت حرکت ربات می باشد.

Already have an account?login

similar resources

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

full text

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

full text

استخراج ویژگی‌ از داده‌های عمق با استفاده از روش یادگیری عمیق برای کنترلِ باناظر ربات چرخ‌دار

این مقاله چارچوبی از یادگیری عمیقِ با ناظر را جهت ناوبری ربات‌ چرخ‌دار در زمین‌های هموار با محوریت وظایف پیگیری دیوار و اجتناب از موانع ارائه می‌نماید. در اینجا، فرض بر این است که ربات تنها به یک سیستم بینایی (دوربین کینکت) مجهز است. چالش‌ اصلی در هنگام استفاده از تصاویر عمق، ابعاد بالای تصاویر و استخراج ویژگی‌های مناسب از آنها با هدف کاهش ابعاد ورودی کنترلگر می‌باشد. برای این منظور در این مقاله...

full text

یادگیری تقویتی برای ربات های فوتبالیست

مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...

توسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله

در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...

15 صفحه اول

طراحی و شبیه سازی ناوبری ربات سیاردر زمین های ناهموار با استفاده از الگوریتم یادگیری تقویتی

در این پایان نامه موضوع ناوبری ربات سیار در محیطی با موانع نرم مورد بررسی قرار گرفته است. در سال‏های اخیر حرکت ربات‏های سیار در محیطهایی که عبور از آنها ممکن اما همراه با هزینه است، نظر بسیاری از محققین را به خود جلب کرده است، به خاطر اینکه به طور گسترده‏ای در رشته‏های گوناگون از قبیل اکتشافات فضایی، نظارت زیرآبی، صنایع نظامی، کاربردهای پزشکی، نجات، و غیره استفاده شده است. برای این کاربردها ناو...

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر

Keywords

ناوبری ربات یادگیری تقویتی یادگیری باناظر سیستم فازی

Hosted on Doprax cloud platform doprax.com